Source

Источник данных — это любое хранилище или система, в которой накапливается и структурируется информация, доступная для извлечения, анализа или передачи в другие системы. Источники данных могут быть разнообразными по структуре и происхождению: от баз данных и файловых систем до API и потоков данных в реальном времени. Они играют ключевую роль в построении систем аналитики, интеграции данных и бизнес-аналитике.

Наиболее часто в бизнесе источниками данных являются:

  • CRM-системы (например, Salesforce, HubSpot CRM) — для данных о клиентах и продажах.
  • Маркетинговые платформы (например,  Яндекс.Директ, Google Ads, VK Ads) и инструменты веб-аналитики (например, Яндекс.Метрика, Google Analytics) — для данных о кампаниях, трафике и пользовательском поведении.

В dataCraft Core извлечение данных из источника осуществляется с помощью Airbyte, где для источников данных создаётся специальная сущность Airbyte Source.

Краткие названия источников данных и принцип наименования аккаунтов

Нейминг - один из важных моментов методологии dataCraft Core. Для каждого элемента существуют свои правила наименования.
В случае с источниками данных,

  • при создании Airbyte Connection
  • в конфигах presets, datasources, connectors
  • при наименовании моделей в dataCraft Core
    используются краткие названия источников (см. таблицу ниже). При работе с источниками, в названиях, должны использоваться только строчные латинские буквы, без пробелов, нижних подчёркиваний и каких-либо других знаков. Такой подход упрощает дальнейшую обработку данных.
Полное название источника Краткое название источника Название аккаунта
Adjust adjust id приложения
AppsFlyer appsflyer id приложения
AppMetrica appmetrica id приложения
myTarget mt id кабинета
UtmCraft utmcraft -
VK Реклама vkads id кабинета
Яндекс Директ yd логин
Яндекс Метрика ym id счётчика
Яндекс Диск ydisk название папки
Google Sheets sheets название страницы
Calltouch calltouch site id
Яндекс ПромоСтраницы promopages id из ссылки на рекламные кампании